R ist eine Programmiersprache, die vor allem im Bereich der Statistik verwendet wird
die Kernprogrammiersprache (core R) wird durch verschiedenste Bibliotheken, Erweiterungen und Weiterentwicklungen verfeinert
R ist open source und freie Software
RStudio ist eine Entwicklungsumgebung für R
RStudio stellt die Nutzer:innenoberfläche und beinhaltet Tools wie einen Viewer, Code-highlighting und vieles mehr
Übersicht
Wenn ihr ein neues Projekt in R angeht, erstellt ein R-Projekt in einem neuen Ordner (File -> New Project)
Damit habt ihr den Arbeitspfad als Ausgangspunkt festgelegt und könnt alle Pfadangaben relativ zum Ausgangspunkt festlegen
Ihr habt außerdem die Möglichkeit eure Arbeitsumgebung für die nächste Session zu speichern
Erstellt jetzt in eurem Projektordner ein R-Skript und öffnet es
R-Skripte sind letztendlich einfach Textdateien, die euren Code enthalten
Ihr könnt entweder den kompletten Code zusammen ausführen oder einzelne Zeilen/Abschnitte
In der Konsole könnt ihr Code ausführen, den ihr nicht für später speichern möchtet
Die Ausgabe wird dann ebenfalls in der Konsole angezeigt
Wenn ihr den Code eines Skripts ausführt, dann findet ihr die Ausgaben ebenfalls in der Konsole
Wenn ihr Daten in Variablen speichert, könnt ihr diese danach in der Arbeitsumgebung sehen
Aktuell sollte eure Arbeitsumgebung noch leer sein
# Die Grundrechenarten in R:
# Addition +
# Subtraktion -
# Multiplikation *
# Division /
(3*3-6)/3+10441 [1] 10442
[1] 10448
Übertragt die Inhalte jeder Box dieses Tutorials in euer geöffnetes Skript
Führt den Inhalt jedes Skripts einzeln aus (Strg + Enter bzw. Strg + R) und versucht dabei jeweils darauf zu achten wie sich die Variablen in der Arbeitsumgebung verändern
Dabei wird jeweils die komplette Zeile, in der sich der Cursor befindet, ausgeführt (oder der markierte Text)
Falls ihr eine Fehlermeldung ausgespuckt bekommt, sagt einfach bescheid!
# Um das Ergebnis einer Berechnung zu speichern, kann es in einer Variable festgehalten werden
# Es gibt zwei Wege einer Variable einen Wert zuzuweisen:
Nummer <- 3
Nummer = 3
# = und <- haben die gleiche Funktion
# Um das Ergebnis spaeter aufzurufen, muss lediglich der Variablenname ausgefuehrt werden
# In der Konsole wird dann der Befehl erneut angezeigt, gefolgt vom Wert der Variable
Nummer[1] 3
R-Funktionen werden durch runde Klammern gekennzeichnet
Funktionen können unterschiedlich viele Eingabe- und Ausgabeargumente haben
Die Funktion mean() berechnet z.B. den Mittelwert aus einer Reihe numerischer Daten
Mit einem ? vor dem Funktionsnamen könnt ihr mehr über die jeweilige Funktion erfahren
[1] 1 2 3
[,1] [,2] [,3]
MyVector 1 2 3
MyVector 1 2 3
MyVector 1 2 3
[,1] [,2] [,3]
[1,] 1 0 0
[2,] 0 1 1
[3,] 0 0 0
[1] "numeric"
# Auch das Ergebnis dieser Funktion kann ich in einer neuen Variable speichern
ClassOfNumber <- class(Number)
# Und was hat das Ergebnis für eine Klasse?
class(ClassOfNumber)[1] "character"
# Auch dieses Ergebnis könnte ihr wieder in einer Variable speichern
ClassOfClassOfNumber <- class(ClassOfNumber)
ClassOfClassOfNumber[1] "character"
# Anführungszeichen markieren für R eine character-Variable
Number <- "3"
# Das geht nicht
Number <- Number + 8Error in Number + 8: nicht-numerisches Argument für binären Operator
[1] "character"
# Die Funktion as.numeric() wandelt eine andere Variablenklasse in einen numerischen Wert um
Number <- as.numeric(Number)
class(Number)[1] "numeric"
[1] 11
[1] NA
[,1] [,2] [,3]
[1,] 1 0 0
[2,] 0 1 1
[3,] 0 0 0
[,1] [,2] [,3]
[1,] 0 -1 -1
[2,] -1 0 0
[3,] -1 -1 -1
# Ich kann alle Berechnungen in einer neuen Variable speichern
MyNewMatrix <- MyMatrix + 3
class(MyNewMatrix)[1] "matrix" "array"
# Wenn man mit (Forschungs-)Datensaetzen arbeitet, bietet es sich meistens an diese als dataframe
# zu speichern, da bei der Matrix-Klasse alle Werte die gleiche Datenklasse haben muessen
MyNewMatrix <- data.frame(MyNewMatrix)
class(MyNewMatrix)[1] "data.frame"